Nature | 打桌游能发Nature了？——游戏技能的提升主要体现在决策深度的增加

原创孔方北京生物结构前沿研究中心 2024-04-28

Journal Club

汇聚思想，点燃新识

Journal Club 凝聚了一批热爱科学、享受科学、传播科学的探索者和发现者。他们志同道合，他们青春飞扬，他们与科学共舞。在这里，你可以收获最新、最真的行业资讯和来自科研一线的文献解读。你关心的就是我们要说的，我们将用最质朴、最客观的文字书写有深度、有温度的科学。Journal Club，与你畅游Journal世界，和你共享科学蔚蓝。

游戏玩的好的人强在哪？

此前人们往往用（国际）象棋这样的桌游来衡量决策的深度，但是这种游戏的复杂性使得难以直接对决策深度进行度量。2023年5月31日，来自纽约大学神经科学中心和心理学系兼普林大学计算机系科学系的Bas van Opheusden 团队于Nature 发表题为Expertise increases planning depth in human gameplay 的文章，研究者使用一种特殊设计的桌游对于这个猜想给出了一个正面的、量化的论证，即：高手就是想的步数多。

我们先来看看这个简单的小桌游，它实际上是井字棋（3*3的三子棋）的扩展，是一个4*9棋盘上的四子棋。（图1a）

（在线游玩：https://weijimalab.github.io/four_in_a_row/play_against_comp.html）

（另，标准的井字棋在双方都正确落子情形下应当永远是和棋局面，这里空间太小，推演过程写不下）

图1. 模型化的决策过程

为了可以量化人类在游戏过程中的一些指标，作者首先提出了一个计算模型，根据参与实验的玩家的游戏对局（玩家与玩家匹配对弈），参数化的模拟每个玩家的行动。模型要做的核心事件，就是对于所有特定特征的数量进行统计，从而进行打分，如图1b所示，所谓特定特征指的是一条长度为4的横/竖/斜线上出现了2个或者更多的同色棋子，且中间没有另一颜色的棋子。说白了就是这些都是有可能连成4的特征。在这个打分基础之上，模型通过决策树的方式扩展，即从每个当前状态都向后假设落1子，并给出所有状态下的打分（图1c）。最后为了模拟一些“失误”情形（人类玩家：“啊！我没看到”），打分系统引入了高斯噪声，并且会以一定比例随机忽略一些特征。

控制模型的参数由特征权重、特征丢失率、决策树大小、剪枝阈值和噪声水平构成，通过对人类玩家对局的拟合，作者发现根据一个玩家行为拟合好的参数可以准确的预测该玩家的其余对局(图2a)，作者也扩展了三种额外的任务：玩家与电脑对局，玩家做残局选择题（2选1），玩家做残局分析。模型均表现出了与其拟合玩家（以一定准确度）吻合的选择。

作者又引入了对于玩家每一步反应用时的预测和对于玩家对局时眼动行为的预测。同样取得了不错的拟合效果（图2）。这意味着这些模型可以用来量化一个玩家的行为，并且可以通过其中的参数观察玩家的差异是如何反应在这些参数上的。

图2 玩家在对局中反应用时和眼动行为的预测

a: 白色圆圈为玩家实际落子区域，红色色块（和强弱）代表了拟合了该玩家的一个模型对于当前落子的概率分布预测。g: 玩家在对弈时的眼动情况，黑色实线是扫视，黄色斑块代表凝视（停留，大小反映停留时长）h ：滤波处理后的玩家眼动概率分布 I : 模型预测的眼动概率分布。

随后，作者通过ELO评分机制（没错，就是现在很多游戏都使用的ELO评分体系）作为玩家水平的表征，统计观察了高ELO评分玩家在这个决策树模型的模拟下，具体哪些参数有了改变，结果如图3所示：

图3. 玩家在接受5阶段游戏训练（每次训练间隔不超过两天）后各项指标的变化

直观来看，所有玩家在接受阶段性训练后游戏水平都有提升，在这个过程中，决策深度显著提升，失误率（漏看）显著下降，而决策搜索的质量（通过计算决策对状态的评分和该状态的真实评分之间互相关得到，用以评价是否准确的评估了一个状态）其实没有本质的提升，甚至在初期的提升后开始逐渐下降。值得注意的是，玩家的整体决策用时逐渐减少，这意味着决策深度的提升并不是简单因为他们用时更长了。

作者随后和Peak（移动应用公司）合作，统计分析了用户们玩不同种类的四子棋——视觉增强版手游数量和这些决策指标的关系：

图4.用户在玩不同款式四子棋之后的表现

核心规律没有变，只有最后一条出现了显著的增强。作者分析发现游戏游玩20款以内时玩家水平其实还不如实验室测试组（5阶段训练组）的第一阶段强，认为可能是因为移动用户整体水平基数低，而引起了他们有很大的提升空间。

总而言之，作者认为这些工作揭示了高手对于新手的区别在哪儿，但是并未能解释这种区别是如何在游戏训练过程中得到提升的。这篇工作为理解人规划、决策提供了一条量化研究的思路——即通过参数化的模型准确模拟人的行为，进而观测不同水平玩家这些参数的变化。也引出了新的有趣的问题：这些能力是如何反应在大脑的神经活动上的？

原文链接

https://doi.org/10.1038/s41586-023-06124-2

van Opheusden, B., Kuperwajs, I., Galbiati, G. et al. Expertise increases planning depth in human gameplay. Nature (2023).

https://doi.org/10.1038/s41586-023-06124-2

关于ELO: (发明者的名字就是Elo)

Elo, A. E. The Rating of Chessplayers, Past and Present (Arco Pub., 1978)

供稿 | 孔方

审稿 | 王雨蒙

责编 | 囡囡

排版 | 可洲

精彩回顾

点击上方卡片

关注我们吧

THE END

我知道你“在看”哟

继续滑动看下一个

北京生物结构前沿研究中心

向上滑动看下一个

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

波罗的海，电缆断裂！

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

萝莉岛事件背后所隐藏的真相，可能比我们想象的更恐怖

Nature | 打桌游能发Nature了？——游戏技能的提升主要体现在决策深度的增加

您可能也对以下帖子感兴趣

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

波罗的海，电缆断裂！

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

萝莉岛事件背后所隐藏的真相，可能比我们想象的更恐怖

生成图片，分享到微信朋友圈

Nature | 打桌游能发Nature了？——游戏技能的提升主要体现在决策深度的增加

您可能也对以下帖子感兴趣